分散和联合学习的关键挑战之一是设计算法,这些算法有效地处理跨代理商的高度异构数据分布。在本文中,我们在数据异质性下重新审视分散的随机梯度下降算法(D-SGD)的分析。我们在D-SGD的收敛速率上展示了新数量的关键作用,称为\ emph {邻居异质性}。通过结合通信拓扑结构和异质性,我们的分析阐明了这两个分散学习中这两个概念之间的相互作用较低。然后,我们认为邻里的异质性提供了一种自然标准,可以学习数据依赖性拓扑结构,以减少(甚至可以消除)数据异质性对D-SGD收敛时间的有害影响。对于与标签偏度分类的重要情况,我们制定了学习这样一个良好拓扑的问题,例如我们使用Frank-Wolfe算法解决的可拖动优化问题。如一组模拟和现实世界实验所示,我们的方法提供了一种设计稀疏拓扑的方法,可以在数据异质性下平衡D-SGD的收敛速度和D-SGD的触电沟通成本。
translated by 谷歌翻译
This study uses multisensory data (i.e., color and depth) to recognize human actions in the context of multimodal human-robot interaction. Here we employed the iCub robot to observe the predefined actions of the human partners by using four different tools on 20 objects. We show that the proposed multimodal ensemble learning leverages complementary characteristics of three color cameras and one depth sensor that improves, in most cases, recognition accuracy compared to the models trained with a single modality. The results indicate that the proposed models can be deployed on the iCub robot that requires multimodal action recognition, including social tasks such as partner-specific adaptation, and contextual behavior understanding, to mention a few.
translated by 谷歌翻译
Sentence simplification aims at making the structure of text easier to read and understand while maintaining its original meaning. This can be helpful for people with disabilities, new language learners, or those with low literacy. Simplification often involves removing difficult words and rephrasing the sentence. Previous research have focused on tackling this task by either using external linguistic databases for simplification or by using control tokens for desired fine-tuning of sentences. However, in this paper we purely use pre-trained transformer models. We experiment with a combination of GPT-2 and BERT models, achieving the best SARI score of 46.80 on the Mechanical Turk dataset, which is significantly better than previous state-of-the-art results. The code can be found at https://github.com/amanbasu/sentence-simplification.
translated by 谷歌翻译
基于人工智能的肺超声成像分析已被证明是整个Covid-19大流行中快速诊断决策支持的有效技术。但是,这种技术可能需要几天或几周的训练过程和超参数调整,以开发智能的深度学习图像分析模型。这项工作的重点是利用“现成”预培训的模型,作为以最小的训练时间为疾病严重程度得分的深度提取器。我们建议在简单和紧凑的神经网络之前使用现有方法的预训练初始化,以减少对计算能力的依赖。在时间限制或资源约束的情况下,例如大流行的早期阶段,计算能力的降低至关重要。在由49位患者组成的数据集中,包括20,000多个图像,我们证明了现有方法作为特征提取器的使用会导致有效分类COVID-19与COVID相关的肺炎严重程度,同时只需几分钟的训练时间。与专家注释的地面真相相比,我们的方法可以在4级的严重程度评分量表上达到超过0.93的准确性,并提供可比的人均区域和全球分数。这些结果表明,在COVID-19患者的临床实践中以及其他呼吸道疾病中,在临床实践中以及在其他呼吸道疾病中的临床实践中快速部署和使用这种最小化适应方法的能力。
translated by 谷歌翻译
最先进的对话模型仍然对事实准确性和自我矛盾甚至困难。轶事,他们已被观察到在整个话语中未能维持性质身份;更具体地,可能会涉及其对话者的作用。在这项工作中,我们正规化和量化这种缺陷,并通过人类评估实验表明这确实是一个问题。相比之下,我们展示了专门识别谁在谈话的歧视模型可以表现良好;此外,这些可以用作自动指标。最后,我们评估了各种缓解方法,包括模型架构,培训协议和解码策略的变化。根据人类的注释者,我们最好的车型减少了近65%的误认为是近65%,同时提高了参与度。尽管有这些结果,但我们发现维持性格身份仍然是一个具有挑战性的问题。
translated by 谷歌翻译
老年人的数量越来越多,对医疗保健以及特别是康复医疗保健令人担忧。辅助技术和辅助机器人特别可能有助于改善这一过程。我们开发一个能够向患者展示康复锻炼的机器人教练,观看患者进行练习并给予他的反馈,以提高他的表现并鼓励他。该系统的HRI基于我们的研究与康复治疗师和目标人群的团队。系统依赖于人类运动分析。我们开发了一种学习概率表达的方法,从专家演示中学习理想运动。使用使用Microsoft Kinect V2捕获的位置和取向特征采用高斯混合模型。为了评估患者的动作,我们提出了一个时间的多级分析,暂时和空间上识别并解释了身体部位误差。该分析与分类算法相结合允许机器人提供教练建议,以使患者提高他的运动。三次康复演习的评价表明了提出的学习和评估Kinaesthetic运动的方法。
translated by 谷歌翻译
本研究提出了一种通过将印刷层的图像与基于G代码的参考图像与搅拌器产生的理想过程的参考图像进行比较来检测3D打印异常的开源方法。通过分析局部图像区域的导向梯度(HOG)直方图的相似性来实现对视觉偏差的认识。开发技术需要初步建模工作环境,以实现最佳方向,色彩渲染,照明和印刷部分的其他参数。算法的输出是印刷和合成参考层之间的不匹配水平。实现了12个相似性和距离措施,并在检测六种不同代表性故障类型及其控制无差错打印图像上检测3D打印误差时的有效性。结果表明,虽然Kendall Tau,Jaccard和Sorensen相似之处是最敏感,Pearson R,Spearman Rho,余弦,骰子相似性产生更可靠的结果。该开源方法允许该程序注意其发生的早期阶段中的严重错误,并且暂停制造过程,以便通过操作员或将来的AI控制的自动纠错进一步调查。这种新方法的实施不需要训练的初步数据,并且可以通过相同几何形状的添加剂或减法制造来实现最大的效率。可以得出结论,这种开源方法是使用复杂原料以及其他具有挑战性的制造环境来实现适应性制造的智能分布回收的有希望的方法。
translated by 谷歌翻译
通过联合学习培训的机器学习模型的收敛速度受到异构数据分区的显着影响,甚至在没有中央服务器的完全分散的设置中。在本文中,我们表明,通过仔细设计潜在的通信拓扑,可以显着降低标签分布偏斜的影响,这是一种重要的数据异质性。我们呈现D-Cliques,一种新颖的拓扑,其通过在稀疏互连的批分中分组节点来减少梯度偏压,使得Clique中的标签分布代表全局标签分布。我们还展示了如何调整分散的SGD的更新,以获得不偏的渐变,并利用D-Cliques实现有效的动量。我们对MNIST和CIFAR10的广泛实证评估表明,我们的方法提供了类似的收敛速度作为完全连接的拓扑,这提供了数据异构设置中的最佳收敛性,并且在边缘和消息的数量下显着降低。在1000节点拓扑中,D-Cliques需要98%的边缘和96%的总信息,在跨越群体中使用小世界拓扑的进一步获得。
translated by 谷歌翻译
监视网络流量数据以检测异常的任何隐藏模式是一个具有挑战性和耗时的任务,需要高计算资源。为此,适当的摘要技术非常重要,在那里它可以是原始数据的替代品。但是,总结数据受到异常的威胁。因此,创建一个可以将与原始数据相同的模式的摘要至关重要。因此,在本文中,我们提出了一种智能摘要方法,用于识别隐藏的异常,称为innident。建议的方法保证了将原始数据分布保持在总结数据。我们的方法是一种基于聚类的算法,它通过每个群集中的本地加权功能动态地将原始要素空间映射到新的特征空间。因此,在新的特征空间中,类似的样本更近,因此,异常值更为可检测。此外,基于簇大小的选择代表与总结数据中的原始数据保持相同的分发。在执行异常检测算法和异常检测算法之前,可以使用载体作为预处理方法。基准数据集的实验结果证明了数据的摘要可以是异常检测任务中的原始数据的替代品。
translated by 谷歌翻译